BSTAT · PROBLEMAS DE DOS MUESTRAS · PUERTA 9

Comparación de
Dos Poblaciones

Marco conceptual para hacer inferencias sobre diferencias de medias y proporciones en muestras independientes, pareadas y grandes.

9.1Medias — Muestras grandes independientesZ · n≥30

9.2Medias — Muestras pequeñas independientest · n<30

9.3Medias — Muestras pareadast · d̄

9.4Dos proporciones poblacionalesZ · p̂

9.5Consideraciones de tamaño de muestran = ?

Ref.: Shafer & Zhang (2012). Introductory Statistics. Saylor Academy. Cap. 9.

00

Diapositiva 02 · Objetivos

Al terminar esta sesión comprenderás…

1

El marco conceptual para comparar dos poblaciones: por qué trabajamos con diferencias de parámetros, qué significa que las muestras sean "independientes" y cuándo aplica cada método.

2

Cómo elegir entre Z y t según el tamaño de muestra y las condiciones que requiere cada uno: normalidad, varianzas iguales e independencia.

3

Por qué el muestreo pareado es un diseño poderoso: cómo calcular diferencias elimina la variabilidad de fondo y te permite enfocarte en el factor de interés.

4

Cómo la lógica de comparar dos proporciones poblacionales es paralela a la de las medias, y cuál es el supuesto crítico de muestras independientes.

5

Cómo pensar en el tamaño de muestra antes de recolectar datos: por qué planear con anticipación ahorra tiempo, dinero y lleva a conclusiones más sólidas.

✦

Diapositiva 03 · Marco general

El panorama general — ¿por qué comparar dos poblaciones?

Idea central

Rara vez nos interesa una sola población de forma aislada. Las preguntas reales son comparativas: ¿El Medicamento A funciona mejor que el B? ¿La Empresa 1 es más confiable que la 2? ¿El proceso nuevo supera al anterior? Todo el capítulo 9 trata sobre hacer inferencias estadísticamente válidas sobre diferencias.

🔑 La idea central en las cinco secciones

Nunca conocemos los parámetros reales μ₁, μ₂, p₁, p₂
Los estimamos con muestras y luego trabajamos con la diferencia
El estimador puntual siempre es la diferencia de estadísticos: x̄₁ − x̄₂ o p̂₁ − p̂₂
Construimos un IC o probamos H₀: parámetro₁ − parámetro₂ = D₀
D₀ = 0 en la mayoría de los problemas reales ("no hay diferencia")

🗺️ Mapa de decisión — ¿cuál método usar?

Situación	Estadístico	Condición clave
Medias, grandes independientes	Z	n₁ ≥ 30 Y n₂ ≥ 30
Medias, pequeñas independientes	t (gl = n₁+n₂−2)	Pobs. normales, σ₁ = σ₂
Medias, pareadas	t (gl = n−1)	Diferencias normales
Proporciones, grandes	Z	Ambas muestras grandes

9.1

Diapositiva 04 · Muestras Grandes Independientes

Comparar medias — muestras grandes e independientes (Z)

Concepto clave — independencia

Dos muestras son independientes si cada una se extrae sin ninguna referencia a la otra. La muestra de la Población 1 no nos dice nada sobre quién queda en la muestra de la Población 2. Esto es lo que hace válido el estadístico Z.

📐 Lógica del intervalo de confianza

IC para μ₁ − μ₂ (grandes, independientes)

(x̄₁ − x̄₂) ± z_α/2 · √(s₁²/n₁ + s₂²/n₂)

La parte ± es el margen de error. El error estándar combina la variabilidad de ambas muestras. Si σ₁ y σ₂ son conocidas, usarlas en lugar de s₁ y s₂.

Estadístico de prueba estandarizado

Z = [(x̄₁ − x̄₂) − D₀] / √(s₁²/n₁ + s₂²/n₂)

Sigue N(0,1). Misma lógica de valor crítico / valor-p que la prueba Z de una población.

💡 Cómo interpretar los resultados

El IC indica un rango de diferencias plausibles

Si el IC contiene solo valores positivos → evidencia de que μ₁ > μ₂
Si contiene solo valores negativos → evidencia de que μ₁ < μ₂
Si cruza el cero → no hay evidencia suficiente de diferencia

Formas de H₀

H₀: μ₁ − μ₂ = D₀ (usualmente 0)
Hₐ izquierda: μ₁ − μ₂ < D₀ · Hₐ derecha: μ₁ − μ₂ > D₀ · Hₐ dos colas: μ₁ − μ₂ ≠ D₀

Idea clave

El método es idéntico al de una población — solo reemplaza la media muestral por la diferencia de medias muestrales.

9.2

Diapositiva 05 · Muestras Pequeñas Independientes

Comparar medias — muestras pequeñas e independientes (t)

Concepto clave — cuando el TCL no aplica

Cuando al menos una muestra es pequeña (n < 30), el Teorema Central del Límite no garantiza la normalidad de x̄. Debemos imponer dos condiciones sobre las poblaciones: ambas son normalmente distribuidas Y tienen desviaciones estándar iguales. A cambio, usamos la distribución t.

🔗 La varianza combinada — por qué existe

Intuición

Asumimos σ₁ = σ₂ (varianzas iguales). En lugar de usar s₁ y s₂ por separado, las combinamos en un estimador mejor: s²p. Es un promedio ponderado, dando más peso a la muestra más grande.

Varianza combinada s²p

s²p = [(n₁−1)s₁² + (n₂−1)s₂²] / (n₁+n₂−2)

gl = n₁ + n₂ − 2

IC y estadístico de prueba (muestras pequeñas)

IC: (x̄₁−x̄₂) ± t_α/2 · √[s²p(1/n₁+1/n₂)]

T = [(x̄₁−x̄₂)−D₀] / √[s²p(1/n₁+1/n₂)]

🆚 Muestras grandes vs. pequeñas — diferencias clave

Aspecto

Grandes (Z)

Pequeñas (t)

Tamaño requerido

Ambas ≥ 30

Al menos una < 30

Distribución pob.

Cualquiera (TCL)

Ambas deben ser normales

¿Varianzas iguales?

No se requiere

Sí se requiere (σ₁ = σ₂)

Estadístico

Z ~ N(0,1)

T ~ t(n₁+n₂−2)

⚠️ Matiz importante

Aunque una muestra sea ≥ 30 y la otra < 30, debes usar el enfoque t de muestras pequeñas. "Pequeña" significa que al menos una es pequeña.

9.3

Diapositiva 06 · Muestras Pareadas

Comparar medias — muestras pareadas · la ventaja del diseño

Concepto clave — eliminar el ruido estadístico

El muestreo pareado es un diseño poderoso: al comparar pares que son iguales en todo excepto el factor de interés, elimina la variabilidad no deseada (ej. diferencias entre autos al comparar combustibles). Esto permite detectar si el tratamiento realmente hace una diferencia.

🔄 La transformación: dos muestras → una muestra

Cómo funciona

Para cada par, calcula d = x₁ − x₂ (¡siempre en el mismo orden!). Ahora tienes una sola muestra de diferencias d₁, d₂, …, dₙ. Trátala como tus datos. El problema se convierte en una prueba t de una muestra sobre d̄.

IC para μd = μ₁ − μ₂ (pareadas)

d̄ ± t_α/2 · (s_d / √n)

gl = n − 1 · Estimador puntual = d̄ · Si n ≥ 30, puede usarse z_α/2

Estadístico de prueba (pareadas)

T = (d̄ − D₀) / (s_d / √n)

H₀: μd = D₀ · Hₐ puede ser izquierda, derecha o dos colas.

⚖️ Pareadas vs. Independientes — cuándo elegir cada una

✅

Usa muestras pareadas cuando…

Las observaciones naturalmente vienen en pares (antes/después, gemelos, sujetos emparejados). La variable de emparejamiento (ej. modelo de auto) podría introducir variabilidad que enmascararía el efecto de interés.

❌

No uses análisis pareado incorrectamente

Si las muestras son verdaderamente independientes (seleccionadas al azar sin emparejamiento), es incorrecto usar las fórmulas pareadas. La estructura de los datos determina el método, no la preferencia del investigador.

¡El orden importa!

Restar siempre en el mismo sentido (siempre Auto 1 menos Auto 2) es crítico. Un orden inconsistente produce un d̄ sin sentido.

9.4

Diapositiva 07 · Dos Proporciones Poblacionales

Comparar dos proporciones — la estructura paralela

Concepto clave — misma lógica, parámetro diferente

Todo lo de las secciones 9.1–9.3 aplica aquí, pero reemplazamos medias con proporciones. El estimador puntual de p₁ − p₂ es p̂₁ − p̂₂. Usamos Z (no t) porque se requieren muestras grandes para que la aproximación normal sea válida.

📐 Fórmulas

IC para p₁ − p₂ (muestras grandes)

(p̂₁−p̂₂) ± z_α/2·√[p̂₁(1−p̂₁)/n₁ + p̂₂(1−p̂₂)/n₂]

Estadístico de prueba

Z = [(p̂₁−p̂₂)−D₀] / √[p̂₁(1−p̂₁)/n₁ + p̂₂(1−p̂₂)/n₂]

✅ Condición de "muestra suficientemente grande"

Ambos intervalos deben estar dentro de [0,1]

Verificar: [p̂ᵢ ± 3√(p̂ᵢ(1−p̂ᵢ)/nᵢ)] ⊂ [0,1] para cada muestra. Es más matizado que simplemente n ≥ 30 — depende del valor de p̂.

⚠️ Advertencia crítica — supuesto de independencia

🚨

La trampa de la encuesta electoral

Si encuestas a las mismas personas y les pides elegir entre el Candidato A y B, entonces p̂A y p̂B provienen de la misma muestra, no de dos muestras independientes. Las fórmulas del IC y el estadístico de prueba de esta sección son inválidas en ese caso.

La lógica es idéntica a la de medias

H₀: p₁ − p₂ = D₀ (usualmente 0)
Hₐ de tres formas: izquierda, derecha o dos colas
Interpretación del IC: ¿incluye el cero?

9.5

Diapositiva 08 · Tamaño de Muestra

Tamaño de muestra — planear antes de recolectar datos

Concepto clave — planear ahorra recursos

Cada muestra cuesta tiempo, dinero y esfuerzo. Antes de recolectar datos, debemos estimar el tamaño mínimo de muestra necesario para lograr un margen de error E deseado con un nivel de confianza dado. Muy pequeña → inconclusiva. Muy grande → desperdicio.

📏 Para medias — muestras independientes

Tamaños iguales mínimos n₁ = n₂

n = (z_α/2)²(σ₁² + σ₂²) / E² (redondear hacia arriba)

Fijamos n₁ = n₂ porque no podemos resolver para dos incógnitas. σ₁ y σ₂ deben conocerse o estimarse de datos previos.

📏 Para medias — muestras pareadas

Número mínimo de pares n (pareadas)

n = (z_α/2)² σ_d² / E² (redondear hacia arriba)

σd es la DE de la población de diferencias. Válido cuando n ≥ 30 (usamos z, no t).

📏 Para proporciones

Tamaños iguales mínimos n₁ = n₂

n = (z_α/2)²[p̂₁(1−p̂₁) + p̂₂(1−p̂₂)] / E²

Si p̂₁ y p̂₂ son desconocidas, usar 0.5 para cada una (estimación conservadora — da el n máximo). Si solo una es desconocida, usar 0.5 solo para esa.

Los tres ingredientes

Toda fórmula de tamaño de muestra necesita exactamente tres cosas:
z_α/2 — del nivel de confianza
σ o p̂ — de conocimiento previo o datos piloto
E — el margen de error máximo deseado, fijado por el investigador

∑

Diapositiva 09 · Síntesis

Los cinco métodos — lado a lado

Sección

Estadístico

Condiciones

Fórmula del EE

Grados de libertad

9.1 Medias, grandes indep.

Z

n₁≥30, n₂≥30, indep.

√(s₁²/n₁ + s₂²/n₂)

∞ (tabla Z)

9.2 Medias, pequeñas indep.

T

Pobs. normales, σ₁=σ₂, indep.

√[s²p(1/n₁+1/n₂)]

n₁+n₂−2

9.3 Medias, pareadas

T

Diferencias normales

s_d/√n

n−1

9.4 Proporciones, grandes

Z

Muestras grandes, indep.

√[p̂₁q̂₁/n₁+p̂₂q̂₂/n₂]

∞ (tabla Z)

El patrón universal de H₀

En las cuatro pruebas, la hipótesis nula tiene la misma forma:
H₀: [parámetro₁] − [parámetro₂] = D₀
Usualmente D₀ = 0 ("sin diferencia"). La alternativa puede ser izquierda, derecha o dos colas.

El IC siempre se interpreta igual

Si el IC contiene el 0 → no hay diferencia significativa al nivel de confianza dado.
Si el IC es completamente positivo → el Parámetro 1 es mayor.
Si el IC es completamente negativo → el Parámetro 2 es mayor.

?

Diapositiva 10 · Verificación de comprensión

Preguntas conceptuales — comprensión, no cálculo

P1

Dos muestras independientes de tamaños n₁ = 45 y n₂ = 18. ¿Cuál método corresponde?

a Z (muestras grandes) — ambas son suficientemente grandes
b ✓ t (muestras pequeñas) — n₂ < 30, por lo que al menos una es pequeña
c t pareada — hay que calcular diferencias

P2

¿Por qué el muestreo pareado suele detectar mejor un efecto real que el muestreo independiente?

a Porque las muestras pareadas siempre son más grandes
b ✓ Porque el emparejamiento elimina la variabilidad de fondo (ruido estadístico), facilitando detectar el efecto del tratamiento
c Porque la distribución t tiene colas más anchas que la Z

P3

Un IC del 95% para μ₁ − μ₂ es [−3.1, 1.4]. ¿Qué puedes concluir?

a μ₁ es significativamente mayor que μ₂
b ✓ No hay evidencia suficiente de diferencia — el IC contiene el cero
c μ₂ es significativamente mayor que μ₁

P4

La varianza combinada s²p se usa en el caso de muestras pequeñas. ¿Qué supuesto la hace válida?

a Los dos tamaños de muestra deben ser iguales
b ✓ Las desviaciones estándar poblacionales deben ser iguales (σ₁ = σ₂), así se justifica combinar dos estimadores del mismo valor
c Las poblaciones deben tener la misma media

P5

En una muestra pareada, olvidas restar siempre en el mismo orden. ¿Qué ocurre?

a El estadístico de prueba se vuelve más grande, lo que es mejor
b ✓ El d̄ calculado pierde sentido — diferencias positivas y negativas se cancelan al azar, ocultando el efecto real
c Nada — el signo de la diferencia no importa

P6

Para planear el tamaño de muestra de dos proporciones sin estimaciones previas de p₁ y p₂, ¿qué valor usas?

a p̂ = 0 para ambas — estimación mínima
b ✓ p̂ = 0.5 para ambas — estimación conservadora que da el tamaño de muestra más grande (y más seguro)
c p̂ = 1 para ambas — estimación máxima

LLEGANDO · PROBLEMAS DE DOS MUESTRAS · TERMINAL 9

Ideas clave

9.1 — Grandes, indep.

Estadístico Z. Ambas n ≥ 30, muestras independientes. Estimador = x̄₁ − x̄₂. Misma lógica IC + hipótesis que una sola población.

9.2 — Pequeñas, indep.

Estadístico t, gl = n₁+n₂−2. Requiere pobs. normales Y σ₁=σ₂. Usa varianza combinada s²p. "Pequeña" = al menos una n < 30.

9.3 — Pareadas

Calcula d = x₁−x₂ por par (¡orden consistente!). t sobre d̄, gl = n−1. Diseño poderoso: elimina variabilidad de fondo.

9.4 — Proporciones

Estadístico Z, muestras grandes. Verificar [p̂±3EE] ⊂ [0,1]. Ojo: p̂A y p̂B de la misma encuesta NO son muestras independientes.

9.5 — Tamaño n

n = (z)²(σ²)/E² · Tres ingredientes: nivel de confianza, DE poblacional y margen de error deseado. Usar 0.5 cuando p̂ es desconocida.

BIBLIOGRAFÍA

Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy.
Capítulo 9: Two-Sample Problems.
saylordotorg.github.io/text_introductory-statistics/s13-two-sample-problems.html

Comparación de Dos Poblaciones

Ideas clave

Comparación de
Dos Poblaciones